Protein

Browse of TCMCG075C10356 protein

CDS


Accession Number	TCMCG075C10356
gbkey	CDS
Protein Id	XP_017973587.1
Location	complement(join(29909387..29909938,29910234..29911334,29911584..29911613,29912379..29912573,29913480..29913947,29914579..29914584))
Gene	LOC18605768
GeneID	18605768
Organism	Theobroma cacao

Protein


Length	783aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA341501
db_source	XM_018118098.1
Definition	PREDICTED: dipeptidyl aminopeptidase 4 isoform X1 [Theobroma cacao]

EGGNOG-MAPPER Annotation


COG_category	O
Description	dipeptidyl peptidase
KEGG_TC	-
KEGG_Module	-
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko00001 [VIEW IN KEGG] ko01000 [VIEW IN KEGG] ko01002 [VIEW IN KEGG] ko04090 [VIEW IN KEGG] ko04147 [VIEW IN KEGG]
KEGG_ko	ko:K01278 [VIEW IN KEGG]
EC	3.4.14.5 [VIEW IN KEGG] [VIEW IN INGREDIENT]
KEGG_Pathway	ko04974 [VIEW IN KEGG] map04974 [VIEW IN KEGG]
GOs	GO:0005575 [VIEW IN EMBL-EBI] GO:0005622 [VIEW IN EMBL-EBI] GO:0005623 [VIEW IN EMBL-EBI] GO:0005737 [VIEW IN EMBL-EBI] GO:0005829 [VIEW IN EMBL-EBI] GO:0044424 [VIEW IN EMBL-EBI] GO:0044444 [VIEW IN EMBL-EBI] GO:0044464 [VIEW IN EMBL-EBI]

Sequence

CDS:
ATGCAGGAGTTCCTTCAATTTGTAATGCAATCAGTTGATGACAGTAAAGAAACGAAGAAGAGTTTGAAGCGATCAAGATCATTGTCCCCTCGGGATATGCCTGTGACCGACTGCACTGCTATGCAAACTATTGACGATTGCATTCTTTTCCCTGTTGAAGAGATAGTCCAATCACCATTGCCTGGATACGTAGCGCCTACCTCTGTTAGTTTTAGTCCGGATGATAGTTTGATAGCTTTTCTATTTAGTCCCGATCACACTTTGAGCAGAAAGGTTTTCACTCTTGATCTCAATGCTGGCAAACAAGAGCTATTTTTCTCTCCCCCGGATGGTGGGCTTGATGAGAGTAATATATCGCCGGAAGAGAAGTTGAGGAGAGAGAGGTCAAGGGAGCGTGGGCTGGGAGTCACACGTTATGAATGGGTGAAGACTATCTCGAAGAAGAAAACTATTATGGTGCCTTTACCTGGAGGGATTTATTTCCAGGAGTTTTCTGATTCAAAACCAGAGCTCAAGCTTCCAAGCATGTCATCATCACCGATCATCGATCCACATCTTTCCCCAGATGGCACTATGCTTGCTTACATAAGAGATTATGAGCTGCATGTTCTGAATCTCTTGTACACTGAACAAAGACAATTAACATTTGGCGCCAATGGGGACATTCTGACTCATGGACTTGCTGAGTATATAGCTCAGGAGGAGATGGATCGAAAAACTGGGTATTGGTGGTCACTAGATAGCAAGTTCATTGCATTTACGGAGGTTGATTATTCTGAGATACCTCTTTTTAGAATTATGCACCAAGGTAAAAGCTCAGTTGGTCCAGAGGCAGAGGAAGACCATGCATATCCTTTTGCAGGAGCTTCAAACGTCAAAGTTCGCCTTGGGGTGGTGTCCACTGCTGGTGCTTCTGTCACTTGGATGGATCTTTTCTGTGGGGGATCAAACTTCGATGACGAATATTTGGCTAGAGTCAACTGGATGCATGGAAATGTTCTTACAGCACAAGTCTTGAATAGGTCTCACTCCAAATTAAAGATCCTTAAGTTTGATATCAAGACAGGCCAAAATAATGTTGTCATGGTTGAAGAACTAAAACCTTGGATTAATCTGCATGACTGCTTTACACCTCTGGACAGAGGAGCCACCAGATATTCTGGGGGGTTCATCTGGGCAAGTGAAAGAACAGGATACAGACATCTTTATCTGCATGATGCTAATGGGACTTGCTTAGGACCCATTACAGAGGGTGACTGGATGGTTGAACAAATTGCTGGTATAAATGAGGCTGCAGGGCTTGTGTATTTCACTGGAACTCTTGATGGACCTTTGGAATCACACCTTTATTATACTAGACTATGCCCAGATGAAAATTCTACTTTGCAAGCTCCCATCAGATTGACTCATGGCAAGGGAAAACATGTGGTTGTGCTTGATCACCACATGCGGAAGTTTGTTGATATTTATGATTCTCTTGATTCTCCCCCTAGAGTTTTGCTTTGCAACTTGATTGATGGAAGTGTAATAATATCTCTTTATGAGCAACCATTCACCATTCCCAGGCTTAAAAGGCTTCAACTTGAGCCTCCAGAGATAGTTCAGATACAGGCAAATGATGGTACCATACTATATGGGGCTATATATAAGCCTGATGCTGCAAGATTTGGTCCTCCACCGTACAAAACCTTGATCAGTGTGTATGGTGGTCCTAGTGTACAGCTCGTATGTGATTCATGGATAAACACAGTTGATATGAGAGCACAATACTTGAGGAGCAAAGGCATTTTAGTTTGGAAGTTAGATAATAGAGGAACGGCTAGACGTGGACTGAAGTTTGAAGGCTGTCTCAAAAACAACATTGGCCGTGTTGATGCTGAGGATCAGCTTACTGGAGCTGAATGGCTAATCAAACAAGGGCTAGCAAAAGCTGGCCATATTGGGTTTTACGGTTGGAGCTATGGTGGTTATCTCTCGGCTATGACCTTGGCTAGGTTTCCTGATGTTTTTCAATGCGCTGTCTCTGGTGCTCCTGTTACATCATGGGATGGATATGACACATTTTACACCGAGAAGTACATGGGATTGCCTTCTGAGGATGCTGAAAGTTATGAGTATAGCTCTGTGATGCACCATGTGAATAAGATGAAAGGAAGGCTGCTATTGGTTCACGGCATGATTGATGAAAATGTACATTTTAGGCACACTGCGAGGCTTGTTAATGCACTTGTGGCAGCTAGAAAGTCGTATGAGCTGTTGATTTTTCCAGATGAACGTCACATGCCACGCCGTCACAGAGACCGAATTTATATGGAAGAGAGGATATGGGAATTCATAGAGAGGAGCTTGTGA

Protein:
MQEFLQFVMQSVDDSKETKKSLKRSRSLSPRDMPVTDCTAMQTIDDCILFPVEEIVQSPLPGYVAPTSVSFSPDDSLIAFLFSPDHTLSRKVFTLDLNAGKQELFFSPPDGGLDESNISPEEKLRRERSRERGLGVTRYEWVKTISKKKTIMVPLPGGIYFQEFSDSKPELKLPSMSSSPIIDPHLSPDGTMLAYIRDYELHVLNLLYTEQRQLTFGANGDILTHGLAEYIAQEEMDRKTGYWWSLDSKFIAFTEVDYSEIPLFRIMHQGKSSVGPEAEEDHAYPFAGASNVKVRLGVVSTAGASVTWMDLFCGGSNFDDEYLARVNWMHGNVLTAQVLNRSHSKLKILKFDIKTGQNNVVMVEELKPWINLHDCFTPLDRGATRYSGGFIWASERTGYRHLYLHDANGTCLGPITEGDWMVEQIAGINEAAGLVYFTGTLDGPLESHLYYTRLCPDENSTLQAPIRLTHGKGKHVVVLDHHMRKFVDIYDSLDSPPRVLLCNLIDGSVIISLYEQPFTIPRLKRLQLEPPEIVQIQANDGTILYGAIYKPDAARFGPPPYKTLISVYGGPSVQLVCDSWINTVDMRAQYLRSKGILVWKLDNRGTARRGLKFEGCLKNNIGRVDAEDQLTGAEWLIKQGLAKAGHIGFYGWSYGGYLSAMTLARFPDVFQCAVSGAPVTSWDGYDTFYTEKYMGLPSEDAESYEYSSVMHHVNKMKGRLLLVHGMIDENVHFRHTARLVNALVAARKSYELLIFPDERHMPRRHRDRIYMEERIWEFIERSL

Browse of TCMCG075C10356 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence